Farina in Natura¶

Relatório - Análise de dados operacionais - ano 2022¶

O método utilizado para a análise dos dados do estabelecimento Farina in Natura foi a análise de dados exploratória. Isso significa que foram realizadas diversas técnicas estatísticas para explorar e compreender melhor os dados, a fim de obter informações relevantes sobre os acontecimentos passados do estabelecimento.

O período analisado foi 01 fevereiro de 2022 a 31 de Outubro 2022

Na análise realizada, a primeira descoberta foi uma divergência nos dados de vendas de itens e faturamento. Após uma análise mais aprofundada, foi constatado que essa divergência foi causada pela falta de entrada de dados no sistema, o que afetou especialmente a venda de croissants. Foi observado que o valor de venda dos croissants era superior ao valor correspondente à sua quantidade, o que sugere a falta de informação referente aos recheios utilizados.

Essa falta de informação é um comportamento não ideal, uma vez que deixamos de saber quais são realmente as preferências do cliente no que diz respeito aos recheios dos croissants. Isso pode afetar negativamente a tomada de decisão do estabelecimento em relação ao estoque de ingredientes, bem como na oferta de produtos mais alinhados com o gosto dos clientes.

Verificando divergência nos dados¶

Observamos na tabela acima que o valor faturado nesses itens, sempre é maior do que o valor unitário do item multiplicado por sua quantidade, o que sugere que algum adicional foi solicitado pelo cliente, mas não foi discriminado como mais um item do pedido.

Após a análise inicial dos dados do estabelecimento Farina in Natura, foi realizada a conversão dos dados brutos e a posterior limpeza das informações. Esse processo envolveu a identificação de dados incorretos ou incompletos, bem como a exclusão de variáveis que não eram relevantes para a análise.

Algumas variáveis que foram enviadas pelo cliente apresentavam uma quantidade significativa de falta de dados, o que tornava difícil a sua utilização na análise. Dessa forma, essas variáveis foram descartadas, a fim de garantir a confiabilidade dos resultados obtidos

Outras variáveis, por sua vez, foram omitidas da análise por não estarem no escopo do projeto.

Exploração dos Dados¶

Algumas métricas importantes foram observadas¶

O número de diferentes itens vendido pela loja é: 212
O número médio de itens vendidos em um dia é: 
102.74
A média de itens por venda é: 2.79 itens
A média de itens por venda e por período do dia é: 
  Período  Média
0   manhã   3.05
2   tarde   2.78
1   noite   2.66

Ao analisar os dados apresentados, notamos que os períodos de maior venda de itens ocorrem principalmente durante a manhã, com uma média superior a três itens por pedido. Essa informação nos permite identificar oportunidades para aumentar a quantidade de itens vendidos por pedido também nos demais períodos, de forma a maximizar as vendas e a rentabilidade do negócio.

Uma das estratégias que pode ser adotada para alcançar esse objetivo é a implementação de promoções e combos de produtos. Os combos são combinações de itens vendidos juntos a um preço atrativo, geralmente com algum desconto em relação à compra dos itens separadamente. Ao oferecer combos, podemos incentivar os consumidores a adquirir uma quantidade maior de produtos por pedido, elevando a média para mais de três itens também nos outros períodos do dia.

Quantidade de itens vendidos por dia ao longo do ano

No gráfico em análise, identificamos dois pontos que se destacam e merecem uma investigação mais detalhada, conforme indicado no próprio gráfico. Vamos abordar cada um desses pontos separadamente:

O primeiro ponto notável ocorreu no dia 23 de junho, quando as vendas atingiram um pico expressivo de 2.303 itens no dia, um valor muito superior à média diária de 102 itens. Esse aumento incomum nas vendas pode ser atribuído a eventos específicos, como promoções, feriados ou atividades de marketing que tenham ocorrido naquele dia. Para entender melhor a causa desse pico, seria necessário investigar as ações realizadas e os fatores externos que possam ter contribuído para esse aumento nas vendas.

O segundo ponto de interesse ocorre no período de 12 a 26 de julho, no qual não foram reportadas vendas de itens. No entanto, no dia 30 de julho, houve uma quantidade atípica de 490 itens vendidos, um valor muito acima da média, mesmo considerando um final de semana, cuja média é de 133 itens. Essa situação pode indicar um problema de registro das vendas no período mencionado ou a ocorrência de eventos específicos que impactaram a demanda pelos produtos. Para esclarecer essa questão, é importante analisar os registros de vendas e as atividades realizadas nesse intervalo de tempo.

Investigando dados atípicos¶

Detalhamento das vendas no dia 23 Junho 2022

Ao analisar os dados referentes ao dia 23 de Junho, notamos que houve um registro no sistema indicando a venda de 2.254 itens no período compreendido entre as 16:00 e 17:00 horas. Essa informação nos leva a acreditar que tal volume de vendas corresponde a um intervalo de tempo consideravelmente mais amplo do que o mencionado. Sendo assim, não é possível determinar com precisão o montante total das vendas desses itens durante o período real de ocorrência ou mesmo associá-las a um evento único que tenha ocorrido no estabelecimento.

Dessa forma, a exclusão desse dia de vendas, que se mostra atípico e fora do padrão operacional habitual, se apresenta como a melhor estratégia para realizarmos uma análise mais imparcial e livre de distorções. Tal medida permitirá que possamos obter resultados mais confiáveis e representativos do desempenho comercial do estabelecimento ao longo do período analisado.

Detalhamento das vendas dia 30 de Julho de 2022¶

Hora Número de Itens Vendidos
0 18 474
1 20 16

Conforme a tabela apresentada, é evidente que este dia foi atípico. As vendas ocorreram apenas nos períodos das 18h às 19h e das 20h às 21h. No primeiro intervalo, as vendas foram muito superiores ao habitual, principalmente porque ocorreram em um curto espaço de tempo, mesmo considerando-se que era um sábado.

Suspeitamos que possam ter sido registradas vendas indevidas, que não pertencem ao período em questão, ou que tenha ocorrido algum evento extraordinário. Seja qual for a razão, é recomendável excluir este dia das nossas análises a fim de evitar distorções ou interpretações equivocadas

Considerando-se o exposto acima, a partir desse ponto as nossas analises serão baseadas nos dados fornecidos pelos gestores do estabelecimento, excluindo-se os dias 23 de Junho e 30 de Julho.

Vendas diárias com a exclusão dos dias atípicos¶

Para oferecer uma visualização mais clara das vendas, excluindo os pontos destacados, apresentamos o gráfico abaixo, que permite uma melhor compreensão das tendências gerais e da sazonalidade das vendas no período analisado:

Após a remoção dos pontos atípicos, ainda é possível observar uma significativa volatilidade no gráfico de vendas ao longo do ano. Essa variação nas vendas pode ser atribuída à diferença marcante entre as vendas realizadas durante os dias da semana e as vendas nos finais de semana, um padrão que será explorado mais detalhadamente a seguir.

Essa flutuação nas vendas sugere que o comportamento dos consumidores e a demanda pelos produtos apresentam um perfil distinto nos dias úteis e nos finais de semana.

Ranking dos produtos mais vendidos¶

A tabela apresentada acima contém o ranking dos itens vendidos ao longo do período de análise no estabelecimento Farina in Natura. A análise desses dados revela que os principais produtos vendidos são relacionados à panificação própria do estabelecimento, sendo que o carro-chefe é o Croissant.

O gráfico apresentado abaixo representa a quantidade de itens vendidos por produto, de forma proporcional às vendas totais de todos os itens no período analisado.

Esse tipo de representação visual permite uma rápida compreensão da contribuição de cada produto para as vendas totais do estabelecimento, facilitando a identificação dos produtos mais populares entre os clientes e a avaliação do desempenho de cada categoria de produtos.

Dessa forma, essa análise pode ser utilizada para identificar oportunidades de melhoria no portfólio de produtos oferecidos, bem como na definição de estratégias de marketing e precificação.

É possível observar que há uma enorme variedade no mix de produtos disponíveis, com um total de 212 produtos distintos vendidos no período analisado. No gráfico acima, os 12 itens em destaque representam os mais vendidos dentre todos. Entretanto, é importante ressaltar que os 200 produtos restantes, que não estão em destaque, correspondem a 64% das vendas totais no período.

Acredito que um mix reduzido de produtos poderia contribuir para uma gestão de estoque mais eficiente, além de facilitar o planejamento e a implementação de estratégias promocionais, como a criação de combos de produtos. Isso porque um mix menor permitiria um melhor controle dos itens em estoque, ajudando a reduzir custos com armazenagem e diminuindo o risco de obsolescência de produtos pouco comercializados.

Itens mais vendidos por período do dia

No gráfico acima, temos uma representação visual do ranking apresentado anteriormente, que mostra a quantidade de itens vendidos por produto, considerando detalhadamente as vendas por períodos do dia (manhã, tarde e noite). Observa-se que os itens mais vendidos são, em sua maioria, produtos de panificação própria e prontos para consumo, com exceção do sanduíche de peperoni e queijo Brie, que requer alguma preparação.

Também é importante destacar os produtos à base de café, que não estão entre os mais vendidos em nenhum dos períodos do dia. O melhor desempenho de um produto à base de café ocorre apenas no período da tarde, ocupando o 12º lugar. Acredita-se que a estratégia de combos promocionais discutida anteriormente possa impulsionar as vendas desses produtos nos diferentes períodos do dia, uma vez que o café e outras bebidas tendem a ter boa margem de lucro. Portanto, o aumento nas vendas desses itens seria benéfico para o negócio.

Itens mais vendidos mês a mês

O gráfico acima apresenta o ranking de produtos vendidos, semelhante ao gráfico anterior, a grande diferença é o periodo, desta vez, o detalhamento é feito mês a mês. A análise desse gráfico revela a predominância nas vendas dos itens à base de croissant, seguidos pelos pasteis de nata.

No início das atividades do estabelecimento(fevereiro), havia uma competição acirrada entre esses dois itens. No entanto, conforme o ano avançou, o croissant se destacou consideravelmente em relação ao pastel de nata. As vendas do croissant, somando-se todo o período analisado, chegaram a ser quase o dobro das vendas do pastel de nata, evidenciando a preferência dos clientes por esse produto.

Essa evolução nas vendas de croissants e pasteis de nata sugere que o estabelecimento pode se beneficiar ao focar na promoção do croissant e na oferta de variações desse produto para atrair ainda mais clientes. Além disso, é importante considerar estratégias para reavivar o interesse dos consumidores pelo pastel de nata, por meio de promoções, eventos temáticos ou aprimoramento da receita.

Vendas dias de semana (DDS) vs Final de semana (FDS)¶

Vendas dia de semana(DDS)¶

O menor número de vendas em um dia de semana foi: 
1
O maior número de vendas em um dia de semana foi: 
241
O número médio de vendas em um dia de semana é: 
75.81

Vendas final de semana (FDS)¶

O menor número de vendas em um dia de fim-de-semana foi: 
65
O  maior número de vendas em um dia fim-de-semana foi: 
227
O número médio de vendas em um dia fim-de-semana é: 
133.74

Número de itens médios vendidos por cada pedido¶

O número médio de itens vendidos por tipo de dia da semana é: 
  Tipo de dia  Média
1         FDS   2.84
0         DDS   2.65

¶

Itens vendidos por tipo de dia¶

No gráfico apresentado, podemos observar claramente uma distinção que já havia sido notada anteriormente: as vendas nos finais de semana apresentam uma média mais elevada em comparação aos dias úteis da semana. Ao analisar a maior parte do gráfico, é possível perceber que a linha representando os finais de semana se encontra acima da linha referente aos dias úteis. Entretanto, há exceções em alguns pontos específicos, nos quais ocorrem dias com vendas excepcionais durante a semana.

Informações gerais sobre vendas¶

O gráfico a seguir ilustra a distribuição da tabela mencionada anteriormente, que classifica as vendas por dia.

Ao aplicar um algoritmo, podemos inferir que as vendas podem ser divididas em quartis, e o Farina in Natura apresenta a seguinte distribuição:

Os 25% inferiores do ranking correspondem aos dias com vendas de até 62,25 itens vendidos. Já os 50% inferiores do ranking incluem os dias com vendas de até 84 itens, valor este que também representa a mediana. Nos 75% inferiores do ranking, encontramos os dias com vendas de até 114 itens. Por fim, os 25% superiores do ranking abrangem os dias com vendas entre 115 e 190 itens.

Valores acima desses limites são considerados outliers ou pontos fora da curva.

Distribuição de vendas por hora do dia¶

A seguir, apresentamos uma análise detalhada da distribuição das vendas ao longo do dia, com base em um gráfico que ilustra o percentual de vendas por faixa horária. A distribuição segue a seguinte estrutura:

  1. Das 6h às 11h da manhã, ocorrem 25% das vendas totais do dia. Este período representa o primeiro quarto das vendas diárias e pode ser atribuído aos consumidores que realizam compras matinais.

  2. Entre as 11h e as 16h, observamos o segundo quarto das vendas, que corresponde a mais 25% do total. Este intervalo de tempo abrange o horário de almoço e o início da tarde, quando muitos consumidores aproveitam para fazer compras.

  3. O terceiro quarto das vendas, que também representa 25% do total, ocorre entre as 16h e as 18h. Neste período, é comum que as pessoas façam compras após o término do expediente de trabalho ou antes de retornarem para casa.

  4. Por fim, os últimos 25% das vendas diárias acontecem das 18h às 21h. Este horário engloba o período da noite e pode estar relacionado com o aumento de compras realizadas após o jantar ou durante o tempo livre.

Esta análise oferece uma visão geral das vendas distribuídas ao longo do dia, facilitando a identificação de padrões de consumo e permitindo que os varejistas otimizem suas estratégias de venda de acordo com as preferências dos clientes.

Itens vendidos por dia da semana

A partir da análise do gráfico apresentado, podemos identificar diferenças notáveis entre as vendas realizadas nos finais de semana e nos dias úteis. As vendas de itens aos sábados e domingos alcançam patamares significativamente superiores, de modo que a média das vendas nesses dias ultrapassa até mesmo os dias de maior movimento durante a semana.

Além disso, os dias de menor movimento nos finais de semana apresentam vendas superiores às médias registradas nos dias úteis. Entre os dias da semana, a sexta-feira se destaca por sua variação nas vendas. A amplitude de vendas nesse dia é bastante grande, provavelmente devido à proximidade com o final de semana.

Embora a média de vendas na sexta-feira seja semelhante à dos demais dias úteis, os valores máximos e mínimos de vendas divergem significativamente. As vendas máximas na sexta-feira são bem maiores, enquanto as vendas mínimas são as menores entre todos os sete dias.

Essa análise proporciona um entendimento mais claro das diferenças nas vendas entre finais de semana e dias úteis, destacando o comportamento dos consumidores e permitindo que os gestores do Farina in Natura ajustem suas estratégias de acordo com essas informações.

Distribuição de vendas por dia da semana e hora do dia¶

Detalhamento do porcentual das vendas pelo periodo do dia¶

Com base nos números de vendas fornecidos, pode-se concluir que as horas de pico para vendas ocorrem entre as 16h e as 20h, com o horário mais lucrativo das 17h às 18h, com um percentual de vendas de 14,3%.

Os horários de pico anteriores são das 15h às 16h, com 5,38% de vendas, seguidos das 19h às 20h, com 10,41% de vendas. A segunda hora mais lucrativa é das 18h às 19h, com 12,57% de vendas.

Os horários de vendas mais baixos ocorrem entre as 6h e as 8h, com menos de 3% de vendas durante esses horários. O horário menos lucrativo é das 21h às 22h, com apenas 1,14% de vendas.

Sugestões¶

Portanto, se o objetivo é maximizar as vendas, seria aconselhável para a empresa aumentar seus recursos (produtos e funcionários) durante os horários de pico, especialmente das 16h às 20h. Além disso, a empresa pode considerar reduzir as horas de operação durante os horários de menor venda(das 06 as 8 horas e depois das vinte uma horas), ou ajustar a oferta de produtos e serviços de acordo com a demanda.

Quantidade de itens vendidos por dia da semana e período¶

Vemos uma clara diferenciação entre o final de semana e os dias da semana: durante a semana, quase os dobros da venda a noite em relação a manhã e tarde. No sábado vemos um aumento significativo das vendas, principalmente pela manhã, que chega bem perto do período noturno. Já no Domingo há uma inversão completa, o período da manhã é o que apresenta a maior quantidade de vendas, apesar de termos um acréscimo do período da noite em relação aos dias de semana.

Analise das vendas, combinação dos itens na preferência do cliente

Para finalizarmos nossa análise, utilizaremos o algoritmo Apriori.

Queremos aumentar o número de itens vendidos de uma maneira que incentive itens que, caso contrário, não seriam comprados. Devemos levar em conta as variáveis que sabemos que alteram a forma como os clientes interagem conosco (ou seja, hora do dia e dia da semana). O resultado final deve fornecer uma direção clara sobre como agir, por que esse curso de ação é desejável e não deve ser muito confuso para o cliente nem muito complexo para um operador.

A compra de qual item leva à compra de quais outros itens? O algoritmo “Apriori” é capaz de responder isso.

Apriori Algorithm¶

O algoritmo “Apriori” nos ajudará a fazer a combinação de itens a serem vendidos em conjunto. Utilizamos a métrica do SUPORTE para acharmos os itens que são mais vendidos. O SUPORTE é calculado dividindo a quantidade de itens vendidos de um determinado produto pela quantidade de todos os itens vendidos. Por exemplo no caso da Farina In Natura, o item que possui o maior SUPORTE é o croissant(0,2063). O algoritmo fara uma combinação dos itens que tem maior SUPORTE com os de menor SUPORTE. Para isso utilizará as métrica da CONFIANÇA e INCREMENTO.

A CONFIANÇA nos dá a probabilidade de o consequente estar presente em uma transação, dado que o antecedente já está presente. Os valores de confiança variam entre 0 e 1. Um valor de confiança próximo a 1 sugere uma forte relação entre antecedente e consequente, enquanto um valor próximo a 0 indica uma relação fraca.

A métrica INCREMENTO é uma medida usada para avaliar a qualidade das regras de associação geradas pelo algoritmo “Apriori”. Ela ajuda a determinar se a relação entre o antecedente e o consequente em uma regra Antecedente->Consequente é significativa ou se ocorre apenas por acaso. Métricas de INCREMENTO maior que 1, nos dizem que antecedentes e consequentes ocorrem juntos mais frequentemente do que esperaríamos se fossem estatisticamente independentes. Ou seja quanto maior o valor do INCREMENTO maior a dependência deles

Na tabela abaixo vemos combinações de itens propostas pelo algoritmo com base nessas métricas e na ordem de decrescente da métrica Incremento.

Esta tabela apresenta regras de associação geradas a partir dos dados de fornecidos pela gerência da Farina. Cada linha representa uma regra de associação entre um antecedente (produto comprado) e um consequente (produto também comprado). A tabela fornece informações sobre suporte do antecedente (proporção de transações contendo o antecedente), suporte do consequente (proporção de transações contendo o consequente), SUPORTE (proporção de transações contendo tanto o antecedente quanto o consequente), CONFIANÇA (probabilidade condicional do consequente dado o antecedente), INCREMENTO (razão do suporte observado para o suporte esperado se antecedente e consequente forem independentes).

Por exemplo, a primeira linha mostra que o antecedente é CROISSANT e o consequente é COCA COLA LATA 350 ML. O suporte do antecedente é 0,206342, o que significa que 20,63% das transações incluem um croissant. O suporte do consequente é 0,036524, o que significa que 3,65% das transações incluem uma lata de 350 ml de Coca Cola. O suporte é 0,009982, o que significa que 0,998% das transações incluem tanto um croissant quanto uma lata de 350 ml de Coca Cola. A confiança é 0,048378, o que significa que há 4,84% de chance de um cliente comprar uma lata de 350 ml de Coca Cola dado que comprou um croissant. O INCREMENTO é 1,324559, indicando que a probabilidade de comprar um croissant e uma lata de 350 ml de Coca Cola juntos é 32,46% maior do que se os dois produtos fossem comprados independentemente.

Podemos utilizar as métricas para fazermos as nossas próprias combinações de acordo com o item que queremos aumentar o nível de vendas. Por exemplo, um item que tenha ainda um suporte baixo mas que tenha uma margem de lucro maior.

As seguintes associações podem ser ofertadas:

CROISSANT - ADICIONAL DE PRESUNTO | 0.007634 CROISSANT - CAFE COLMEIA C/ LEITE G 200ML | 0.010452 CROISSANT - ADICIONAL DE MUSSARELA | 0.011274 PASTEL DE NATA 60G - AGUA MINERAL C/GAS 500ML | 0.023605 PASTEL DE NATA 60G - QUICHE DE TOMATE SECO SALADA | 0.025484

Observações finais e sugestões aos gestores

Principais descobertas

  • Houve uma divergência nos dados de vendas de itens e faturamento, causada pela falta de entrada dos dados relacionados ao recheio do croissant.
  • O estabelecimento vendeu 212 itens diferentes, com uma média de 2,79 itens por venda.
  • As vendas variaram significativamente ao longo do dia e da semana, com picos nos finais de semana e períodos noturnos.
  • Foram identificados pontos de atenção nos gráficos de vendas, como dias com vendas muito altas ou baixas, que podem precisar de análise mais aprofundada.
  • A análise do algoritmo Apriori revelou combinações de itens com alto suporte, confiança e incremento, sugerindo possíveis promoções e estratégias para aumentar as vendas de itens menos populares.

Sugestões aos gestores

  • Treinar funcionários para inserir os pedidos de forma mais detalhada, evitando a falta de dados.
  • Rever o horário de funcionamento da loja, considerando os períodos de menor movimento (primeira hora da manhã e após as 21h).
  • Implementar promoções e combos de produtos, com base nos resultados do algoritmo Apriori, para aumentar as vendas de itens menos populares, especialmente durante os horários de baixo movimento.
  • Realizar análises periódicas dos dados de vendas para identificar tendências, oportunidades e possíveis problemas operacionais.

Com base nessas descobertas e sugestões, os gestores do estabelecimento Farina in Natura podem tomar decisões informadas e eficientes para melhorar suas operações, aumentar as vendas e a satisfação dos clientes.